Model Selection

Wikipedia corpus

# Wikipedia corpus

Multilingual Albert Base Cased 128k

A multilingual ALBERT model pretrained with masked language modeling (MLM) objective, supporting 60+ languages, featuring a lightweight architecture with parameter sharing

Large Language Model

Transformers Supports Multiple Languages

Multilingual Albert Base Cased 32k

Multilingual ALBERT model pretrained with masked language modeling objective, supporting 50+ languages, case-sensitive

Large Language Model

Transformers Supports Multiple Languages

Tinybert General 4L 312D De

This is a TinyBERT model optimized for German, created by distilling the BERT base cased model, suitable for natural language processing tasks.

Large Language Model

Transformers German

Gpt2 Small Indonesian 522M

This is a GPT2-small model pretrained on Indonesian Wikipedia data, specializing in Indonesian text generation tasks.

Large Language Model Other

A pretrained model based on Slovak language, using masked language modeling (MLM) objective, case-sensitive.

Large Language Model

Transformers Other

Gpt2 Small Arabic

A GPT2 model trained on Arabic Wikipedia dataset based on gpt2-small architecture, suitable for text generation tasks.

Large Language Model Arabic

Electra Small Japanese Generator

An ELECTRA model pre-trained on Japanese Wikipedia, suitable for Japanese text processing tasks.

Large Language Model

Transformers Japanese

Bert Base Japanese Upos

BERT model pre-trained on Japanese Wikipedia text for POS tagging and dependency parsing

Sequence Labeling

Transformers Supports Multiple Languages

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase